Freigeben über


Daten, Datenschutz und Sicherheit für Azure OpenAI Service

Von Bedeutung

Nicht englische Übersetzungen werden nur zur Bequemlichkeit bereitgestellt. Bitte wenden Sie sich an die EN-US Version dieses Dokuments für die Bindungsversion.

Dieser Artikel enthält Details dazu, wie Daten, die Sie dem Azure OpenAI-Dienst zur Verfügung stellen, verarbeitet, verwendet und gespeichert werden. Azure OpenAI speichert und verarbeitet Daten, um den Dienst bereitzustellen und auf Verwendungen zu überwachen, die gegen die geltenden Produktbedingungen verstoßen. Siehe auch den Microsoft Products and Services Data Protection Addendum, der die Datenverarbeitung durch den Azure OpenAI-Dienst regelt. Azure OpenAI ist ein Azure-Dienst; erfahren Sie mehr über die anwendbaren Azure-Complianceangebote.

Von Bedeutung

Ihre Eingabeaufforderungen (Eingaben) und Fertigstellungen (Ausgaben), Ihre Einbettungen und Ihre Schulungsdaten:

  • sind NICHT für andere Kunden verfügbar.
  • sind nicht für OpenAI verfügbar.
  • werden NICHT verwendet, um OpenAI-Modelle zu verbessern.
  • werden NICHT verwendet, um Azure OpenAI Service Foundation-Modelle zu trainieren, neu zu trainieren oder zu verbessern.
  • werden nicht verwendet, um Produkte oder Dienste von Microsoft oder Drittanbietern ohne Ihre Zustimmung oder Anweisung zu verbessern.
  • Ihre fein abgestimmten Azure OpenAI-Modelle stehen ausschließlich für Ihre Verwendung zur Verfügung.

Der Azure OpenAI-Dienst wird von Microsoft als Azure-Dienst betrieben; Microsoft hostt die OpenAI-Modelle in der Azure-Umgebung von Microsoft, und der Dienst interagiert nicht mit Diensten, die von OpenAI betrieben werden (z. B. ChatGPT oder die OpenAI-API).

Welche Daten verarbeitet der Azure OpenAI-Dienst?

Azure OpenAI verarbeitet die folgenden Datentypen:

  • Eingabeaufforderungen und generierte Inhalte. Aufforderungen werden vom Benutzer übermittelt, und Inhalte werden vom Dienst über die Vervollständigungen, Chatabschlüsse, Bilder und Einbettungen generiert.
  • Hochgeladene Daten. Sie können ihre eigenen Daten für die Verwendung mit bestimmten Dienstfeatures (z. B. Feinabstimmung, Assistenten-API, Batchverarbeitung) mithilfe der Dateien-API oder des Vektorspeichers bereitstellen.
  • Daten für zustandsbehaftete Entitäten. Wenn Sie bestimmte optionale Features des Azure OpenAI-Diensts verwenden, z. B. das Threads-Feature der Assistenten-API und gespeicherter Fertigstellungen, erstellt der Dienst einen Datenspeicher, um den Nachrichtenverlauf und andere Inhalte gemäß der Konfiguration des Features zu speichern.
  • Erweiterte Daten, die in oder über Eingabeaufforderungen enthalten sind. Wenn Sie Daten verwenden, die mit zustandsbehafteten Entitäten verknüpft sind, ruft der Dienst relevante Daten aus einem konfigurierten Datenspeicher ab und erweitert die Eingabeaufforderung, um Generationen zu erzeugen, die auf Basis Ihrer Daten erstellt werden. Eingabeaufforderungen können auch durch Daten erweitert werden, die aus einer Quelle abgerufen wurden, die in der Eingabeaufforderung selbst enthalten ist, z. B. eine URL.
  • Schulungs- und Validierungsdaten. Sie können Ihre eigenen Schulungsdaten bereitstellen, die aus Eingabeaufforderungspaaren für die Feinabstimmung eines OpenAI-Modells bestehen.

Wie verarbeitet Azure OpenAI Service Ihre Daten?

Das folgende Diagramm veranschaulicht, wie Ihre Daten verarbeitet werden. Dieses Diagramm behandelt mehrere Arten von Verarbeitungen:

  1. Wie der Azure OpenAI-Dienst Ihre Eingabeaufforderungen über die Ableitung zum Generieren von Inhalten verarbeitet (einschließlich, wenn zusätzliche Daten aus einer bestimmten Datenquelle zu einer Eingabeaufforderung hinzugefügt werden, die Azure OpenAI für Ihre Daten, Assistenten oder Batchverarbeitung verwendet).
  2. Wie die Funktion "Assistenten" Daten in Verbindung mit Nachrichten, Threads und Abläufen speichert.
  3. Wie die Batchfunktion Ihre hochgeladenen Daten verarbeitet.
  4. Wie der Azure OpenAI-Dienst ein fein abgestimmtes (benutzerdefiniertes) Modell mit Ihren hochgeladenen Daten erstellt.
  5. Wie der Azure OpenAI-Dienst und das Microsoft-Personal Eingabeaufforderungen und -fertigstellungen (Text und Bild) auf schädliche Inhalte und Muster analysieren, die die Verwendung des Diensts auf eine Weise vorschlagen, die gegen den Verhaltenskodex oder andere anwendbare Produktbedingungen verstößt.

Datenflussdiagramm für den Dienst.

Wie im obigen Diagramm dargestellt, können verwaltete Kunden sich bewerben, um die Missbrauchsüberwachung zu ändern.

Generieren von Vervollständigungen, Bildern oder Einbettungen durch Ableitung

Modelle (Basis- oder Feinabstimmung), die in Ihrer Ressource bereitgestellt werden, verarbeiten Ihre Eingabeaufforderungen und generieren Antworten in Form von Text, Bildern oder Embeddings. Kundeninteraktionen mit dem Modell werden logisch isoliert und gesichert, indem technische Maßnahmen verwendet werden, einschließlich, aber nicht beschränkt auf die Transportverschlüsselung von TLS1.2 oder höher, Sicherheitsumgebung, Tokenisierung von Texten und exklusiven Zugriff auf den zugewiesenen GPU-Speicher. Aufforderungen und Fertigstellungen werden in Echtzeit für schädliche Inhaltstypen ausgewertet, und die Inhaltsgenerierung wird basierend auf konfigurierten Schwellenwerten gefiltert. Weitere Informationen finden Sie unter Azure OpenAI Service-Inhaltsfilterung.

Aufforderungen und Antworten werden innerhalb der vom Kunden angegebenen Geografie verarbeitet (es sei denn, Sie verwenden einen globalen Bereitstellungstyp), können jedoch zwischen Regionen innerhalb der Geografie für betriebliche Zwecke (einschließlich Leistung und Kapazitätsverwaltung) verarbeitet werden. Informationen zum Verarbeitungsort bei Verwendung eines globalen Bereitstellungstyps finden Sie unten.

Die Modelle sind zustandslos: Keine Eingabeaufforderungen oder Generierungen werden im Modell gespeichert. Darüber hinaus werden Eingabeaufforderungen und Generationen nicht verwendet, um die Basismodelle zu trainieren, neu zu trainieren oder zu verbessern.

Grundlegendes zum Standort der Verarbeitung für die Bereitstellungstypen "Global" und "Datenzone"

Neben Standardbereitstellungen bietet Azure OpenAI Service Bereitstellungsoptionen, die als "Global" und "DataZone" bezeichnet werden. Für jeden Bereitstellungstyp mit der Bezeichnung „Global“, können Prompts und Antworten in jeder Region, in der das relevante Azure OpenAI-Modell bereitgestellt wird (weitere Informationen zur Regionale Verfügbarkeit von Modellen), verarbeitet werden. Für alle Bereitstellungstypen, die als „DataZone“ bezeichnet werden, können Prompts und Antworten in jeder Geografie innerhalb der angegebenen Datenzone verarbeitet werden, wie von Microsoft definiert. Wenn Sie eine DataZone-Bereitstellung in einer Azure OpenAI-Ressource erstellen, die sich in den USA befindet, werden Prompts und Antworten möglicherweise überall in den USA verarbeitet. Wenn Sie eine DataZone-Bereitstellung in einer Azure OpenAI-Ressource erstellen, die sich in einem Mitgliedsstaat der Europäischen Union befindet, können Prompts und Antworten in diesem oder einem anderen Mitgliedsstaat der Europäischen Union verarbeitet werden. Für die Bereitstellungstypen „Global“ und „DataZone“ werden alle ruhenden Daten, z. B. hochgeladene Daten, in der vom Kunden festgelegten Geografie gespeichert. Nur der Standort der Verarbeitung ist betroffen, wenn ein Kunde eine Bereitstellung vom Typ „Global“ oder „DataZone“ in Azure OpenAI Service verwendet; Azure-Datenverarbeitungs- und Complianceverpflichtungen gelten weiterhin.

Das Erweitern von Eingabeaufforderungen, um die generierten Ergebnisse anhand Ihrer Daten zu verankern

Mit der Azure OpenAI-Funktion „auf Ihren Daten“ können Sie Datenquellen verbinden, um die generierten Ergebnisse mit Ihren Daten abzustimmen. Die Daten bleiben in der datenquelle und am von Ihnen angegebenen Speicherort gespeichert; Der Azure OpenAI-Dienst erstellt keinen doppelten Datenspeicher. Wenn eine Benutzeraufforderung empfangen wird, ruft der Dienst relevante Daten aus der verbundenen Datenquelle ab und erweitert die Eingabeaufforderung. Das Modell verarbeitet diese erweiterte Eingabeaufforderung und der generierte Inhalt wird wie oben beschrieben zurückgegeben. Erfahren Sie mehr darüber, wie Sie das Feature "On Your Data" sicher verwenden.

Datenspeicher für Azure OpenAI-Dienstfeatures

Einige Azure OpenAI Service-Features speichern Daten im Dienst. Diese Daten werden entweder vom Kunden mithilfe der Dateien-API oder des Vektorspeichers hochgeladen oder automatisch in Verbindung mit bestimmten zustandsbehafteten Entitäten wie dem Threads-Feature der Assistenten-API und gespeicherten Fertigstellungen gespeichert. Gespeicherte Daten für Azure OpenAI Service-Features:

  • Wird im Ruhezustand in der Azure OpenAI-Ressource des Kunden-Mandanten innerhalb derselben Geografie gespeichert.
  • Ist standardmäßig mit der AES-256-Verschlüsselung von Microsoft immer verschlüsselt, mit der Möglichkeit, einen vom Kunden verwalteten Schlüssel zu verwenden (bestimmte Vorschaufeatures unterstützen möglicherweise keine vom Kunden verwalteten Schlüssel).
  • Kann jederzeit vom Kunden gelöscht werden.

Hinweis

Azure OpenAI-Features in der Vorschau unterstützen möglicherweise nicht alle oben genannten Bedingungen.

Gespeicherte Daten können mit den folgenden Dienstfeatures/-funktionen verwendet werden:

  • Erstellen eines angepassten (fein abgestimmten) Modells. Erfahren Sie mehr über die Funktionsweise der Feinabstimmung. Feinabgestimmte Modelle sind ausschließlich für den Kunden verfügbar, deren Daten zur Erstellung des fine-tuned Modells verwendet wurden, sind im Ruhezustand verschlüsselt (wenn nicht zur Ableitung bereitgestellt) und können jederzeit vom Kunden gelöscht werden. Für die Feinabstimmung hochgeladene Schulungsdaten werden nicht zum Trainieren, Neutraining oder Verbessern von Microsoft- oder Drittanbieterbasismodellen verwendet.
  • Batchverarbeitung: Erfahren Sie mehr darüber , wie die Batchverarbeitung funktioniert. Batchverarbeitung ist ein weltweiter Bereitstellungstyp; Ruhende Daten verbleiben in der vorgesehenen Azure-Region, bis ausreichende Verarbeitungskapazität verfügbar ist; die Verarbeitung kann in jeder Region erfolgen, in der das entsprechende Azure OpenAI-Modell bereitgestellt wird (weitere Informationen zur Verfügbarkeit von Modellen in der Region).
  • Assistenten-API (Vorschau) Erfahren Sie mehr darüber , wie die Assistenten-API funktioniert. Einige Features von Assistenten, z. B. Threads, Speichern des Nachrichtenverlaufs und anderer Inhalte.
  • Gespeicherte Fertigstellungen (Vorschau) Gespeicherte Abschlüsse speichern Eingabe-/Ausgabepaare aus von Kunden bereitgestellten Azure OpenAI-Modellen wie GPT-4o, die über die Chat-Abschlüsse-API verarbeitet werden, und zeigen die Paare im Azure AI Foundry-Portal an. Auf diese Weise können Kunden Datasets mit ihren Produktionsdaten erstellen, die dann zur Auswertung oder Feinabstimmung von Modellen (wie in den geltenden Produktbedingungen zulässig) verwendet werden können.

Verhindern von Missbrauch und schädlicher Inhaltsgenerierung

Um das Risiko einer schädlichen Verwendung des Azure OpenAI-Diensts zu verringern, umfasst der Azure OpenAI-Dienst sowohl Inhaltsfilterung als auch Missbrauchsüberwachungsfunktionen. Weitere Informationen zur Inhaltsfilterung finden Sie unter Inhaltsfilterung von Azure OpenAI Service. Weitere Informationen zur Überwachung von Missbrauch finden Sie unter "Missbrauchsüberwachung".

Inhaltsfilterung erfolgt synchron, während der Dienst Eingabeaufforderungen verarbeitet, um wie oben und hier beschrieben Inhalte zu generieren. Es werden keine Eingabeaufforderungen oder generierten Inhalte in den Inhaltsklassifizierermodellen gespeichert, und Aufforderungen und Ausgaben werden nicht verwendet, um die Klassifizierermodelle ohne Ihre Zustimmung zu trainieren, neu zu trainieren oder zu verbessern.

Sicherheitsbewertungen fein abgestimmter Modelle bewerten ein fein abgestimmtes Modell für potenziell schädliche Reaktionen mithilfe der Risiko- und Sicherheitsmetriken von Azure. Nur die daraus resultierende Bewertung (bereitstellbar oder nicht bereitstellbar) wird vom Dienst protokolliert.

Das Azure OpenAI-Missbrauchsüberwachungssystem wurde entwickelt, um Instanzen von wiederkehrenden Inhalten und/oder Verhaltensweisen zu erkennen und zu mindern, die die Verwendung des Diensts auf eine Weise vorschlagen, die gegen den Verhaltensregeln oder andere anwendbare Produktbedingungen verstoßen kann. Wie hier beschrieben, verwendet das System Algorithmen und Heuristiken, um Indikatoren für potenziellen Missbrauch zu erkennen. Wenn diese Indikatoren erkannt werden, kann eine Stichprobe der Aufforderungen und Fertigstellungen des Kunden zur Überprüfung ausgewählt werden. Die Überprüfung erfolgt standardmäßig von LLM mit zusätzlichen Überprüfungen durch menschliche Prüfer nach Bedarf. Detaillierte Informationen über KI und menschliche Überprüfung finden Sie bei der Azure OpenAI Service-Missbrauchsüberwachung.

Zur KI-Überprüfung werden die Aufforderungen und Fertigstellungen des Kunden nicht vom System gespeichert oder zum Trainieren der LLM oder anderer Systeme verwendet. Für die menschliche Überprüfung wird der Datenspeicher, in dem Aufforderungen und Fertigstellungen gespeichert werden, logisch durch die Kundenressource getrennt (jede Anforderung enthält die Ressourcen-ID der Azure OpenAI-Ressource des Kunden). Ein separater Datenspeicher befindet sich in jeder Geografie, in der der Azure OpenAI-Dienst verfügbar ist, und die Aufforderungen und generierten Inhalte eines Kunden werden in der Azure-Geografie gespeichert, in der die Azure OpenAI-Dienstressource des Kunden bereitgestellt wird, innerhalb der Azure OpenAI-Dienstgrenze. Menschliche Prüfer, die potenziellen Missbrauch bewerten, können nur dann auf Eingabeaufforderungen und Abschlussdaten zugreifen, wenn diese Daten bereits vom Missbrauchsüberwachungssystem gekennzeichnet wurden. Die menschlichen Prüfer sind autorisierte Microsoft-Mitarbeiter, die mithilfe von Anforderungs-IDs, Secure Access Workstations (SAWs) und Just-In-Time (JIT) auf die Daten zugreifen, die von Teammanagern erteilt wurden. Für azure OpenAI-Dienst, der im Europäischen Wirtschaftsraum bereitgestellt wird, befinden sich die autorisierten Microsoft-Mitarbeiter im Europäischen Wirtschaftsraum.

Wenn der Kunde für die Überwachung geänderter Missbrauchsverletzungen genehmigt wurde (weitere Informationen zur Azure OpenAI Service-Missbrauchsüberwachung), speichert Microsoft nicht die Aufforderungen und Fertigstellungen im Zusammenhang mit den genehmigten Azure-Abonnements, und der oben beschriebene Prozess der menschlichen Überprüfung ist nicht möglich und wird nicht ausgeführt. Die KI-Überprüfung kann jedoch weiterhin durchgeführt werden, wobei LLMs genutzt werden, die Aufforderungen und Fertigstellungen zum Zeitpunkt der Bereitstellung oder Generierung überprüfen, sofern zutreffend.

Hinweis

Azure Preview-Features, einschließlich Azure OpenAI-Modelle in der Vorschau, können verschiedene Datenschutzpraktiken verwenden, einschließlich in Bezug auf die Missbrauchsüberwachung. Vorschauen unterliegen möglicherweise ergänzenden Bedingungen unter: Ergänzende Nutzungsbedingungen für Microsoft Azure Previews.

Wie kann ein Kunde überprüfen, ob die Datenspeicherung für die Missbrauchsüberwachung deaktiviert ist?

Es gibt zwei Möglichkeiten für Kunden, nachdem sie die Missbrauchsüberwachung deaktiviert haben, um zu überprüfen, ob die Datenspeicherung für die Missbrauchsüberwachung in ihrem genehmigten Azure-Abonnement deaktiviert wurde:

  • Verwenden des Azure-Portals oder
  • Azure CLI (oder eine beliebige Verwaltungs-API).

Hinweis

Der Wert von "false" für das Attribut "ContentLogging" wird nur angezeigt, wenn die Datenspeicherung für die Missbrauchsüberwachung deaktiviert ist. Andernfalls wird diese Eigenschaft nicht im Azure-Portal oder in der Azure CLI-Ausgabe angezeigt.

Voraussetzungen

  1. Anmelden bei Azure
  2. Wählen Sie das Azure-Abonnement aus, das die Azure OpenAI Service-Ressource hosten soll.
  3. Navigieren Sie zur Übersichtsseite der Azure OpenAI-Dienstressource.
  1. Zur Seite "Ressourcenübersicht" wechseln

  2. Klicken Sie auf den JSON-Ansichtslink in der oberen rechten Ecke, wie in der abbildung unten dargestellt.

    Json-Ansicht des Protokollierungsstatus im Azure-Portal.

In der Liste "Fähigkeiten" wird ein Wert namens "ContentLogging" angezeigt, der auf FALSE festgelegt wird, wenn die Protokollierung zur Missbrauchsüberwachung deaktiviert ist.

{ 
    "name":"ContentLogging",
    "value":"false"
}

Weitere Informationen zu den Datenschutz- und Sicherheitsverpflichtungen von Microsoft finden Sie im Microsoft Trust Center.

Änderungsprotokoll

Datum Änderungen
17. Dezember 2024 Informationen zur Datenverarbeitung und -speicherung in Verbindung mit dem neuen Feature "Gespeicherte Vervollständigungen" wurden hinzugefügt; erläuternde Sprache wurde hinzugefügt, um klarzustellen, dass die Azure OpenAI-Features in der Vorschau möglicherweise nicht alle Bedingungen zur Datenspeicherung unterstützen; die Bezeichnung "Vorschau" für die Batchverarbeitung wurde entfernt.
18. November 2024 Informationen zum Speicherort der Datenverarbeitung für neue Bereitstellungstypen der Datenzone wurden hinzugefügt; zusätzliche Informationen zur neuen KI-Überprüfung von Eingabeaufforderungen und -vervollständigungen im Rahmen der Verhinderung von Missbrauch und Generierung schädlicher Inhalte
4. September 2024 Zusätzliche Informationen (und überarbeiteten vorhandenen Text entsprechend) zur Datenverarbeitung für neue Features, einschließlich Assistenten-API (Vorschau), Batch (Vorschau) und globale Bereitstellungen; überarbeitete Sprache im Zusammenhang mit dem Speicherort der Datenverarbeitung gemäß den Grundsätzen der Azure-Datenbewahrung; Zusätzliche Informationen zur Datenverarbeitung für Sicherheitsbewertungen von fein abgestimmten Modellen; klargestellte Verpflichtungen im Zusammenhang mit der Verwendung von Eingabeaufforderungen und -vervollständigungen; kleinere Überarbeitungen zur Verbesserung der Klarheit
23. Juni 2023 Zusätzliche Informationen zur Datenverarbeitung für das neue "Azure on your data"-Feature hinzugefügt; Informationen zur Missbrauchsüberwachung entfernt, die nun unter Azure OpenAI Service Missbrauchsüberwachung verfügbar sind. Zusammenfassungsnotiz hinzugefügt. Aktualisierte und optimierte Inhalte und aktualisierte Diagramme zur weiteren Übersichtlichkeit. Änderungsprotokoll hinzugefügt

Siehe auch